Un modèle générique d'organisation de corpus en ligne: application à la FReeBank
نویسندگان
چکیده
The few available French resources for evaluating linguistic models or algorithms on other linguistic levels than morpho-syntax are either insufficient from quantitative as well as qualitative point of view or not freely accessible. Based on this fact, the FREEBANK project intends to create French corpora constructed using manually revised output from a hybrid Constraint Grammar parser and annotated on several linguistic levels (structure, morphosyntax, syntax, coreference), with the objective to make them available on-line for research purposes. Therefore, we will focus on using standard annotation schemes, integration of existing resources and maintenance allowing for continuous enrichment of the annotations. Prior to the actual presentation of the prototype that has been implemented, this paper describes a generic model for the organization and deployment of a linguistic resource archive, in compliance with the various works currently conducted within international standardization initiatives (TEI and ISO/TC 37/SC 4). MOTS-CLÉS : ressources linguistiques, annotation multi-niveau, normalisation, ressources
منابع مشابه
Conception objet dans le cadre des systèmes d'information spatiaux: Agrégation spatiale et généralisation
Notre propos est de témoigner de l'apport du paradigme objet et notamment du formalisme UML dans l'élaboration et la confrontation de modèles conceptuels. Traitant des problèmes de gestion de l'espace rural, nous portons notre attention sur les notions de représentation du paysage. En particulier, nous précisons l'intérêt du concept d'agrégation utilisé à des fins structurelles et dynamiques. N...
متن کاملEvolutivité des applications Web: un méta-modèle exécutable
RESUME. Les processus de développement pilotés par le modèle ont été pensés avec in fine l'objectif d'une évolution régulière et incrémentale. Peu d'outillage pourtant existe afin de supporter la coévolution des modèles et de leur méta-modèle. De nombreux travaux s'intéressent au développement piloté par le modèle des applications Web centrées sur les données, mais peu parmi ceux-ci s'intéresse...
متن کاملSémantique et réutilisation d'ontologie générique
Dans ce papier, nous enrichissons la méthode Terminae de construction d'ontologie à partir de textes en proposant une semi-automatisation de la construction du modèle conceptuel. Nous présentons un algorithme permettant la conceptualisation d'un terme en s'appuyant sur les informations linguistiques contenues dans l'ontologie générique de référence.
متن کاملAnalyse spatiotemporelle des vecteurs de mouvement : application au comptage des personnes
Résumé. Cet article présente une nouvelle approche qui permet de compter le nombre d’individus franchissant une ligne de comptage . L’approche proposée accumule dans le temps les vecteurs de mouvement pour chaque point de la ligne de comptage formant une carte spatiotemporelle. Une procédure de détection en ligne des blobs est ensuite utilisée afin de déterminer les régions de la carte spatiote...
متن کاملDiagnostic multi-sources adaptatif. Application à la détection d'intrusion dans des serveurs Web
Résumé. Le but d’un système adaptatif de diagnostic est de surveiller et diagnostiquer un système tout en s’adaptant à son évolution. Ceci passe par l’adaptation des diagnostiqueurs qui précisent ou enrichissent leur propre modèle pour suivre au mieux le système au fil du temps. Pour détecter les besoins d’adaptation, nous proposons un cadre de diagnostic multi-sources s’inspirant de la fusion ...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
- CoRR
دوره abs/cs/0611026 شماره
صفحات -
تاریخ انتشار 2005